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ii 要 : 传统 网 络 缓存 系统 中 数据 包 级 别 的 缓存 难以 实现 ， 信 息 中 心 网 络 的 出 现 使 这 个 难题 得 以 缓解 。 即 使 如 此 ， 数 
据 包 级 别 的 缓存 仍然 面临 严重 的 扩展 性 问题 。 通 过 分 析 当 前 限制 数据 包 级 别 缓存 实现 的 若干 问题 ， 提 出 了 一 种 分 组 报 
文 缓存 优化 方法 。 这 种 方法 通过 根据 分 组 前 级 而 非 单 个 报 文 前 级 建立 索引 来 减少 高 速 存储 器 的 使 用 量 ， 同 时 分 组 级 别 
的 流行 度 也 用 于 优化 缓存 决策 。 定 义 了 大 量 的 评估 指标 ， 并 通过 广泛 的 实验 来 评估 此 方案 的 性 能 。 实 验 结 果 表 明 ， 与 
之 前 的 数据 包 级 别 的 缓存 方案 相 比 ， 此 方法 可 以 大 大 减少 高 速 存储 器 使 用 量 ， 并 且 在 服务 器 负载 减少 率 、 平 均 跳 数 减 
少 率 和 平均 缓存 命中 率 方 面 取 得 显 着 改善 
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Abstract: Packet-level caching is difficult to implement in the traditional caching system. The emergence of Information-centric 


networking has alleviated this problem. However, the packet-level caching is still facing severe scalability issues. This paper 
analyzed the issues which limit the implementation of packet-level caching and proposed a packet-level caching optimization 


approach. This scheme reduces the consumption of fast memory by creating the index with group prefixes instead of the packet 


prefixes, while the group-level popularity is also used to optimize caching decision. This paper evaluated the performance of the 
scheme through extensive simulation experiments regarding a wide range of performance metrics. The experimental results 
indicate the scheme can reduce the fast memory usage and achieve significant improvement in terms of server load reduction 


ratio, average hop reduction ratio and average cache hit ratio, compared with current packet-level caching schemes. 
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然而 ， 在 传统 的 TCP/IP 网 络 中 ， 数 据 包 级 别 的 缓存 却 难以 实 

现 ， 因 为 它 需要 借助 诸如 DPI 等 会 产生 较 高 开销 的 技术 ， 这 将 

现今 互联 网 的 主流 应 用 已 经 由 端 到 端 模式 的 通信 和 转变 为 了 造成 严重 性 能 瓶 项 和 扩展 性 问题 。 

以 内 容 分 发 和 获取 为 主 的 应 用 。 根 据 思科 VNI GR p AAR 传统 缓存 中 数据 包 级 别 的 缓存 所 面临 的 问题 可 以 通过 新 近 

= 预测 , 预计 2021 年 内 容 获 取 类 应 用 产生 的 网 络 流量 (如 互联 ”出 现 的 信息 中 心 网 络 架 构 (information-centric networking, ICN) 
网 视频 、Web 数据 、 文 件 共享 等 ) 将 占 总 网 络 流量 的 85% 以 上 。 KED, ICN 架构 采用 了 接受 者 驱动 的 通信 模型 ， 并 且 将 命 
网 络 缓存 这 是 缓解 上 述 流量 压力 的 重要 技术 之 一 。 网 络 缓存 设 。 名 的 数据 作为 网 络 中 传输 的 基本 元 素 。 通 过 名 字 可 以 标识 这 些 
备 可 以 暂 存 内 容 对 象 并 响应 之 后 的 用 户 请 求 。 一 些 研究 指出 ， 数据 包 ， 因 此 在 ICN 体系 结构 中 ,命名 的 数据 可 以 存储 在 任何 
相 比 于 整个 内 容 对 象 的 缓存 ， 更 细 的 粒度 的 缓存 〈 比 如 数据 包 有 缓存 能 力 的 网 络 设备 中 〈 如 路 由 器 )。 当 请 求 消息 到 达 时 ， 网 
级 别 的 缓存 ) 能 够 获得 更 好 的 缓存 效果 。 因 为 数据 包 级 别 的 缓 络 设 备 可 以 从 其 存储 库 中 检索 内 容 数 据 。 如 果 内 容 已 被 缓存 ， 
存 可 以 做 出 更 细 粒 度 的 缓存 决策 ， 从 而 可 以 进一步 提高 网 络 性 则 可 以 直接 响应 用 户 请 求 ， 而 无 需 将 请 求 转 发 向 内 容 服务 器 。 
能 ， 尤 其 是 当 对 象 的 不 同 部 分 具有 不 同 的 流行 度 时 和 we 。 ， 这样, 网络 带宽 消耗 和 内 容 服务 器 的 负载 可 以 显 着 降低 .同时 ， 
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于 请 求 延 迟 的 减少 ， 用 户 体验 也 将 大 大 改善 。 

ICN 架构 的 出 现 缓解 了 数据 包 级 别 缓存 遇 到 的 一 些 问 题 ， 
然而 ，ICN 架构 下 数据 包 级 别 的 缓存 在 实现 上 仍然 存在 诸多 挑 
战 : 高 速 存 储 器 (如 SRAM) 的 容量 限制 ;对 于 线 速 转发 的 要 求 ; 
数据 包 级 别 的 流行 度 统计 等 。 

为 了 以 较 低 的 成 本 实现 数据 包 级 别 的 缓存 ， 本 文 根 据 空间 
局 部 性 原理 , 引入 一 种 了 基于 分 组 数据 包 的 缓存 方法 (grouped- 
packet caching，GPC)。 在 GPC 中 ， 我 们 使 用 分 组 前 缀 代替 单 
个 报 文 的 前 级 来 建立 索引 项 目 以 减少 高 速 存储 器 容量 的 消耗 。 
另 一 方面 我 们 利用 一 个 Bloom Filter 的 存储 器 来 过 滤 无 效 缓存 
查询 请 求 ， 从 而 加 速 请 求 转发 。 此 外 ， 我 们 使 用 分 组 的 流行 度 
来 优化 缓存 决策 。 具 体 来 说 ， 本 文 的 主要 贡献 总 结 如 下 : 

a) 本 文 分 析 了 限制 数据 包 级 别 缓存 实现 的 相关 问题 。 
基于 空间 局 部 性 原理 ， 引 入 分 组 报 文 的 概念 来 缓解 数据 包 级 别 
缓存 中 存在 的 扩展 性 问题 。 

b) 本 文 提出 了 一 种 名 为 GPC 的 数据 包 级 别 的 缓存 机 制 , 可 
以 显著 加 速 那 些 未 缓存 的 数据 包 的 转发 过 程 ， 同 时 大 大 降低 高 
速 存储 器 的 使 用 量 。 

9 定义 了 若干 评价 指标 来 评估 GPC 机 制 的 效果 。 实验 结果 
表明 ， 高 速 存储 器 的 使 用 量 显 着 降低 。 同 时 ， 与 主流 的 儿 种 包 
级 别 的 缓存 方案 相 比 ，GPC 显示 出 了 更 优 的 缓存 性 能 。 


1 ”相关 工作 


在 传统 TCP/IP 网 络 中 ， 卫 数据 包 由 五 元 组 标识 ， 而 其 有 
效 负载 对 网 络 设备 不 可 见 。 为 了 实现 数据 包 级 别 的 网 络 缓存 ， 
则 需要 通过 特定 的 方法 〈 如 suppressing replicated data, delta 
coding 或 深度 包 检 测 等 ) 来 消除 数据 元 余 。 由 于 计算 开销 成 本 
过 高 ， 在 传统 的 TPC/IP 网 络 难以 实现 数据 包 级 别 的 缓存 。 因 
此 ， 传 统 网 络 缓存 通常 存储 完整 的 数据 对 象 而 不 是 单独 的 数据 
包 。 


近来 出 现 的 信息 中 心 网 络 (ICN ) 使 数据 包 级 别 的 缓存 变 得 


势 ， 并 提出 了 一 种 量化 效用 的 方法 。 评 估 结 果 表 明 ， 简 单 的 基 
于 效用 的 网 内 缓存 算法 和 低 复杂 度 的 均匀 分 块 足以 发 挥 分 块 组 
存 的 最 大 优势 。Thomas 4 APARRA 提出 了 一 种 面向 内 容 对 
象 的 数据 包 级 别 的 缓存 机 制 COPC). Æ OPC H, RERIK 
是 基于 整个 对 象 而 建立 ， 而 非 针 对 单个 的 数据 包 建 立 (一 个 
对 象 可 以 划分 为 多 个 数据 包 )。 通 过 这 种 方法 可 以 大 大 节省 高 速 
内 存 使 用 量 。 为 了 实现 数据 包 级 别 的 缓存 ， 在 这 种 机 制 中 缓存 
系统 中 需要 连续 保存 对 象 的 前 n 个 块 而 没有 间隙 ， 并 且 在 缓存 
索引 中 加 以 标识 。 OPC 可 以 解决 数据 包 缓 存 的 两 个 常见 问题 : 
循环 蔡 换 和 大 对 象 污染 问题 。 但 是 ， 由 于 作者 没有 考虑 对 象 内 
部 的 流行 度 差 异 ， 因 此 缓存 性 能 仍 有 提升 空间 。 此 外 存储 连续 
的 n 的 数据 块 的 方法 不 够 灵活 (分 块 缓存 必须 按 序 存储 ), 造成 
做 出 的 缓存 决策 也 较为 僵化 。 
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在 总 结 上 述 已 有 工作 的 基础 上 ， 提 出 了 一 种 新 的 数据 包 级 

别 缓存 的 优化 方法 。 
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图 1 数据 包 流行 度 差异 
2 问题 分 析 


2.1 有 限 的 存储 资源 

在 一 个 网 络 缓存 设备 中 ， 内 容 数据 通常 存放 在 DRAM 或 
者 SSD 等 低速 存储 器 中 ， 而 查询 索引 则 存储 在 SRAM 等 高 速 
存储 器 中 。 在 传统 缓存 中 , 一 条 索引 对 应 一 个 整体 的 内 容 对 象 ， 
而 在 包 级 别 的 缓存 系统 中 ， 一 条 索引 对 应 一 个 独立 的 数据 包 。 


可 行 。ICN 体系 结构 将 对 象 划分 为 命名 的 数据 块 ， 用 户 通过 向 


于 一 个 内 容 对 象 通常 可 以 划分 为 大 量 的 数据 包 ， 相 应 所 需 的 


网 络 发 送 一 系列 包含 数据 块 名 称 的 请 求 来 获取 内 容 对 象 。 这 些 
命名 的 数据 块 可 以 缓存 在 任何 具有 缓存 能 力 的 ICN 设备 中 , 这 
些 设备 也 可 以 响应 对 已 缓存 数据 块 的 请 求 。 

于 ICN 的 出 现 , 数据 包 级 别 的 缓存 方案 引起 了 更 多 研究 
人 员 的 关注 ,在 文献 错误 ! 未 找到 引用 源 。 错误! 未 找到 引用 源 。 
中 , 作者 通过 确定 内 容 缓存 的 位 置 来 提高 整体 缓存 效果 。 但 是 ， 


a) 


索引 条 目的 数量 也 大 大 增多 了 。 由 此 可 知 ， 与 对 象 存储 相 比 ， 
数据 包 级 别 的 缓存 需要 占用 更 多 的 高 速 内 存 来 存储 索引 表 ， 而 
高 速 存 储 器 的 成 本 限制 了 数据 包 级 别 缓存 的 发 展 。 

2.2 ”无效 的 缓存 查找 

在 ICN 架构 中 ， 缓 存 系 统 不 再 是 单个 缓存 设备 ， 而 是 一 个 
大 量 设备 组 成 的 复杂 的 缓存 网 络 。 尽 管 缓存 网 络 的 总 体 容量 


它们 没有 考虑 内 容 流行 度 的 对 缓存 性 能 的 影响 ， 而 事实 上 这 一 
点 是 不 能 忽视 的 。 最 近 ， 学 者 们 普遍 认识 到 内 容 流行 对 提高 组 
存 性 能 起 着 至 关 重 要 的 作用 ”和 因此, 一 些 缓存 策略 通 


ra 


可 以 很 大 ， 但 由 于 受到 线 速 转发 的 条 件 的 制约 ， 单 个 缓存 节点 
的 缓存 容量 大 大 受 限 。 由 于 这 个 限制 ， 单 个 缓存 节点 具有 相对 
较 低 的 缓存 命中 率 。 换 句 话说， 大 多 数 用 户 请 求 不 会 被 单个 组 


过 同时 考虑 缓存 位 置 和 内 容 流行 度 来 提高 缓存 效率 [9 5。 然而 ， 


存 设备 满足 ， 而 这 些 未 命中 的 请 求 应 该 直接 转发 到 下 一 跳 。 尽 


这 些 研究 缺乏 对 对 象 流行 度 和 数据 包 流行 度 之 间 的 关系 的 分 析 
同时 忽略 了 数据 包 级 别 流行 度 统计 量 的 开销 ， 这 将 会 产生 严重 
的 扩展 性 问题 。 

在 文献 错误 ! 未 找到 引用 源 。 中 ,作者 阐述 了 分 块 缓存 的 优 


管 如 此 ， 路 由 器 总 是 查询 外 部 存储 器 中 的 索引 表 ， 这 将 会 导致 
性 能 瓶颈 。 

2.3 数据 包 级 别 流行 度 的 难题 

为 了 提高 网 络 缓存 系统 的 效率 ， 将 高 热度 的 内 容 对 象 快速 
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推送 到 网 络 边缘 至 关 重 要 。 在 传统 的 网 络 缓存 系统 中 ， 缓 存 节 AR. AI, 基于 内 容 对 象 的 热度 统计 , A 的 热度 可 能 被 低估 ， 
点 通常 存储 整个 对 象 而 不 是 数据 包 。 实 际 上 ， 一 个 内 容 对 象 的 这 可 能 会 减少 缓存 这 些 数据 包 的 几率 。 在 图 1 \b) 中 ，C 的 序 
不 同 部 分 , 特别 是 视频 文件 等 , 可 能 具有 不 同 的 流行 度 。 因 此 ， 号 小 于 D, 但 D 的 热度 更 高 。 在 这 种 情况 下 ， 优 先 选择 内 容 对 
包 级 别 的 缓存 的 可 以 提高 缓存 性 能 "但 是 , 基于 对 象 | 象 中 排 在 前 面 的 数据 包 的 缓存 方法 〈 如 OPC 错误 ! 未 找到 引用 
级 别 的 流行 统计 不 能 充分 发 挥 数 据 包 级 别 缓存 的 优势 ， 因 为 使 YR) 将 过 高 估计 C 部 分 的 热度 ， 而 决定 缓存 C 而 不 是 热度 更 
用 对 象 的 流行 度 统计 来 估计 数据 包 的 流行 度 通常 是 不 准确 的 。 高 的 D。 以 上 两 种 情况 都 由 于 存储 了 热度 较 低 的 内 容 而 导致 组 
我 们 在 图 1 用 一 个 简单 例子 来 说 明 这 个 问题 。 在 图 1 (a) 中 ， ” 存 性 能 的 下 降 。 由 此 可 知 数据 包 级 别 的 热度 统计 对 于 提升 缓存 
内 容 对 象 1 的 整体 热度 高 于 内 容 对 象 2。 然 而 ， 对 于 部 分 A 和  ” 性 能 十 分 重要 。 但 同时 这 也 会 带 来 过 多 系统 的 开销 ， 因 此 阻碍 
部 分 B， 可 以 看 到 ，A 中 的 数据 包 比 B 中 的 数据 包 具 有 更 高 的 了 包 级 别 缓存 的 发 展 。 
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i Bloom Filter | / 替换 策略 容器 | 
(硬件 加 速 ) | | (高 速 存 储 器 ) 
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| 1 | | ndn/video/00 [II ar | 
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| | 
| AU 
| fo) | E = : . — L2% } 
| 加 | | (低速 存储 踊 ) | 
SEE 和 
图 2 CS 索引 数据 结构 

数据 包 ， 并 且 数 据 包 的 顺序 号 为 57。 

= 3 方案 设计 数据 i 省 且 数 据 包 的 顺序 号 为 

© 3.2 缓存 机 制 

CN 31 系统 模型 3.2.1 报 文 分 组 

> 为 了 简化 描述 ， 本 文 以 ICN 体系 结构 中 的 典型 代表 NDN 通常 情况 下 ， 索 引 条 目 使 用 哈 希 表 结构 存储 于 高 速 存储 器 


(named data networking) 作为 示例 来 演示 本 文 的 缓存 机 制 。 中 。 哈 希 表 的 优点 是 高 效 : 元 素 操作 〈 如 查找 ， 插 入 和 删除 ) 
在 本 文中 ， 认 为 一 个 NDN 网 络 由 多 个 具有 有 限 容量 缓存 。 的 时 间 复 杂 度 为 O (1)。 但 是 ， 与 对 象 级 别 的 缓存 不 同 ， 报 文 
存储 结构 (content store, CS) 的 路 由 器 组 成 。 在 NDN 体系 结 级 别 的 缓存 中 存储 的 最 小 单位 是 数据 包 。 由 于 一 个 内 容 对 象 通 
构 中 ， 存 在 两 种 类 型 的 数据 包 ， 即 Interest 报 文 和 Data 报 文 。 常 由 至 少数 百 个 块 组 成 ， 因 此 会 生成 大 量 索 引 条 目 ， 从 而 需要 
每 一 个 Data 数据 包 都 具有 一 个 名 字 前 绥 , 客户 端 发 送 包含 该 名 5 用 大 量 的 高 速 内 存 空间 来 存储 这 些 索引 条 目 。 但 事实 上 ， 隶 
字 前 级 的 Interest 数据 包 到 网 络 中 以 获取 相应 的 Data 数据 包 。 属于 同一 个 对 象 的 不 同 数据 包 ， 它 们 的 对 象 前 缀 都 相同 ， 区 另 
中 间 路 由 器 根据 存储 在 转发 信息 库 (FIB) 中 的 信息 将 请 求 逐 跳 仅仅 是 最 后 的 序号 部 分 。 因 此 ， 减 少 内存 消 耗 的 一 个 可 能 的 解 
转发 至 内 容 持 有 者 。 转 发 信息 库 通 过 基于 名 称 的 路 由 协议 (如 | 决 方 案 是 采用 字典 树 结构 来 存储 索引 。 然 而 ， 尽 管 字典 树 可 以 
OSPEN #8 #835158 p} NLSR ARRAIA ) 建立 。 在 请 求 过 程 中 ， 通过 共享 相同 的 对 象 前 绥 来 节省 存储 空间 ， 但 字典 树 的 查询 效 
路 由 器 的 Pending Interest Table (PIT) 结构 中 记录 该 请 求 过 程 。” 率 相 对 较 低 ， 尤 其 是 当前 级 的 数量 较 大 时 。 例 如 ， 要 搜索 前 级 


的 路 径 的 信息 ， 通 过 这 些 信息 ，Data 数据 包 可 以 沿 着 反 向 路 径 ”mdn/file/video/sample/37， 它 需要 进行 五 次 匹配 的 操作 。 为 了 兼 

返回 到 请 求 者 。 顾 查 询 效 率 和 存储 空间 节省 ， 采 用 了 分 组 报 文 索引 的 方式 。 
此 外 ， 假 设 Data 数据 包 的 大 小 等 于 网 络 的 MTU 默认 为 根据 空间 局 部 性 原理 : 如 果 在 某 个 特定 的 时 间 里 某 个 特定 

1500 Byte)。 同时 NDN 路 由 器 中 具有 内 容 热 度 统计 表 (PST), 数据 块 被 请 求 ， 则 相近 的 数据 块 也 可 能 在 近期 被 请 求 。 基 于 上 


可 以 记录 和 更 新 一 段 时 间 内 数据 包 的 访问 热度 ,缓存 的 Data 数 述 观 点 ,将 N 个 连续 数据 包 作为 一 个 分 组 ， 并 将 该 组 中 第 一 个 
据 包 存储 在 低速 存储 器 中 ， 例 如 DRAM 或 SSD 等 。 而 索引 信 BGAN ACHAT EAT. RPM RIAA 
息 则 存储 在 如 SRAM 的 高 速 存储 器 中 。NDN 中 数据 包 的 名 字 ” 组 前 级 来 创建 的 。 在 每 个 索引 条 目 中 ， 添 加 一 个 Bit-Map 结构 
对 象 前 级 (Object_Prefix) 和 序号 (Seq) 组 成 ， 其 中 序号 表 来 标识 分 组 中 的 某 个 数据 包 是 否 已 被 缓存 。 当 且 仅 当 相 应 的 位 
示 该 数据 包 在 内 容 对 象 中 的 顺序 。 例 如 ， 名 字 前 级 值 为 1 时， 表明 该 数据 包 被 缓存 ， 反 之 该 值 为 0 时 ， 表 示 该 数 
/ndn/file/video/sample/57 RRX &/ndn/file/video/sample 的 一 个 据 包 未 被 缓存 。 实 际 的 Data 数据 包 以 unorder_set 的 形式 被 存 
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储 在 低速 存储 器 中 。unorder_set 是 一 种 基于 哈 希 表 的 容器 ， 其 了 增加 对 移 除 操作 的 支持 我 们 采用 的 Bloom Filter 的 一 种 扩展 
检索 的 时 间 复 杂 度 为 O (1)。 索 引 条 目 包含 一 个 指针 ， 指 向 低 结构 Counting Bloom Filter。 路 由 器 缓存 的 Ll 索引 条 目的 各 项 
速 存储 器 中 的 该 分 组 的 容器 。 此 外 ， 高 速 存储 器 中 还 包含 一 个 ”操作 都 被 同步 到 Bloom Filter 中 。 由 于 存储 在 LI 索引 中 的 条 目 
侵入 式 列表 ， 用 来 对 索引 条 目 进 行 排序 来 完成 蔡 换 功 能 。 图 2 是 基于 分 组 前 级 的 ， 所 以 存储 在 Bloom Filter 中 的 相应 元 素数 
中 描述 了 GPC 策略 使 用 的 数据 结构 ,缓存 模块 的 核心 操作 包括 量 也 大 大 减少 了 .例如 ,对 于 配备 了 4GBytes DRAM 的 路 由 器 ， 
有 : 当 分 组 大 小 为 32 并 且 Bloom Filter 的 假 阳性 概率 为 0.05 时 , 只 

a) 插 入 。 路 由 器 首先 根据 数据 包 隶 属 的 分 组 的 前 级 创建 索 需要 273KBytes 来 存储 分 组 前 级 。 而 如 果 要 存储 所 有 的 报 文 前 
引 条 目 ( 如 果 此 条 目 此 前 未 创建 ), 然后 将 相应 的 Bit-Map 的 位 级 ，Bloom Filter 所 需 的 容量 大 约 是 8.5MBytes。 显 然 ， 基 于 分 
值 设置 为 1。 组 报 文 的 缓存 不 但 可 以 减少 L1 索引 条 目的 数量 也 可 以 降低 所 

b) 换 出 。 将 Bit-Map 中 的 相应 位 值 设 置 为 0。 此 外 ， 如 果 该 需 的 Bloom Filter 的 容量 。 所 需 的 Count Bloom Filter 的 容量 可 
索引 条 目的 Bit-Map 中 所 有 值 均 为 0, 则 同时 删除 该 索引 条 目 。 以 通过 式 (1) 计算 。 其 中 Cworge 表示 低速 存储 器 的 容量 ， 

cj 查找。 根据 数据 包 隶 属 的 的 分 组 前 绥 首 先 查 找 L1 级 索 packet_size 表示 数据 包 的 大 小 ，group_size 表示 分 组 的 大 小 ，& 
引 。 如 果 找 到 分 组 前 级 ， 则 路 由 器 检查 BitMap 。 如 果 对 应 位 表示 假 阳 性 的 概率 。 
值 为 1， 则 路 由 器 访问 低速 存储 器 以 检索 块 数据 。 否 则 直接 转 


1 
C xl xl — 
发 请 求 。 storage ” 108, € 08,0) 0 
3.2.2 请 求 过 滤 2x packet_sizex group _ size 
正如 之 前 所 讨论 的 ， 由 于 缓存 容量 的 限制 ， 单 个 路 由 器 无 当 用 户 请 求 到 达 时 ， 路 由 器 首先 测试 Bloom Filter 以 确定 
法 满足 大 部 分 的 用 户 请 求 。 为 了 加 速 数据 包 转 发 ， 我 们 利用 LI 索引 中 是 否 存在 该 分 组 前 级 。 如 果 测 试 结果 为 真 ， 则 路 由 器 
个 芯片 内 置 的 Bloom Filter 来 减少 外 部 存储 器 的 访问 次 数 。 继续 访问 外 部 高 速 存储 器 以 完成 后 续 操 作 。 否 则 ， 路 由 器 直接 


Bloom Filter 是 一 种 查询 效率 很 高 并 且 占 用 空间 较 小 的 数据 结 ”转发 请 求 。 这 样 ， 绝 大 多 数 的 用 户 请 求 将 被 过 滤 ， 并 且 访 问 外 
构 ， 可 以 快速 而 高 效 地 对 集合 的 内 容 进行 检索 。 将 索引 信息 同 部 存储 器 的 次 数 大 大 减少 。 图 3 (a) 描述 了 Interest 报 文 的 处 
步 到 Bloom Filter 中 。 通 常 的 Bloom Filter 只 支持 插入 操作 ， 为 里 流程 。 
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图 3 数据 包 处 理 流程 
3.2.3 分 组 级 别 的 热度 统计 WARE TA. BME UF: 
数据 包 级 别 的 热度 统计 很 难 实现 ， 因 为 它 将 产生 巨大 的 开 threshold = 0 x Min( popularity) @¢€[0,1] (2) 


销 ， 尤 其 是 是 存储 空间 的 消耗 。 因 此 ， 我 们 提出 了 分 组 级 别 的 其 中 Min (popularity) 表示 当前 存储 在 CS 中 的 内 容 的 热度 的 
热度 统计 的 概念 。 根 据 空 间 局 部 性 原理 可 以 推 知 ， 顺 序 上 临近 最 小 值 。0 是 一 个 调整 参数 ， 用 来 适应 网 络 中 内 容 对 象 热度 的 
的 报 文具 有 相似 的 请 求 热度 。 因 此 ， 我 们 使 用 分 组 热度 代 奉 数 动态 变化 ， 较 小 的 0 什 适 合 于 网 络 内 容 热 度 变化 较 快 的 场景 。 
据 包 热 度 来 辅助 路 由 器 做 出 缓存 决策 。 路 由 器 在 PST 中 记录 分 图 3 Cb) 描述 了 Data 数据 包 处 理 的 流程 。 
日 热度 信息 ， 并 根据 分 组 前 缀 创建 索引 。 这 样 将 大 大 减少 热度 
统计 带 来 的 开销 。 4 ”性 能 评估 

当 Data 数据 包 到 达 时 ， 路 由 器 查找 PST 以 获取 该 数据 
隶属 的 分 组 的 热度 。 如 果 它 的 热度 值 大 于 一 个 的 阔 值 ， 则 吕 
器 决定 存储 该 Data 数据 包 。 和 否则 ， 路 由 器 只 转发 Data 数据 
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41 实验 设 定 
为 了 评估 本 方案 的 实际 性 能 ， 本 文 在 ndnSIM PARRER. 
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上 实现 了 该 方案 。ndnSIM 是 一 个 基于 NS-3 SRR 实现 的 路 由 器 节点 ， 其 余 节 点 为 中 间 路 由 器 节点 。 设 定 每 个 节点 的 组 
模块 ， 加 入 了 NDN 特性 的 数据 结构 和 转发 逻辑 。 基 于 ndnSIM ” 存 容量 为 1000 个 数据 包 ,Bloom Filter 的 默认 容量 为 150 Byte, 
增加 了 一 些 数据 结构 并 修改 了 部 分 转发 逻辑 来 实现 GPC 方案 。 且 将 其 变化 范围 设 定 为 90~210 Bytes 来 考察 其 容量 对 过 滤 效 
在 实验 评估 里 ， 定 义 了 三 种 不 同 分 组 大 小 的 方案 ， 其 大 小 分 别 。 果 的 影响 。 请 求 速率 设置 为 200 个 请 求 /s。 除 了 Zipf 分 布 参数 、 
为 8、16 和 32， 命 名 为 GPC-8，GPC-16 和 GPC-32。 本 文 将 这 ”分 块 数量 和 Bloom Filter 容量 外 ， 其 余 参 数 都 固定 为 默认 值 ， 
三 种 GPC 策略 与 如 下 包 级 别 的 缓存 策略 进行 对 比 : 表 1 描述 了 实验 的 主要 参数 设置 。 
a)CEE (cache everything everywhere)?!; 每 一 个 缓存 设备 都 表 1 实验 参数 设 定 
会 将 经 过 的 任何 数据 包 缓存 下 来 。 参数 默认 值 变化 范围 
b)OPC (object-oriented packet caching #®! P> P®:. [面向 内 Zip 分 布 参数 a 1.0 0.7~1.3 
容 对 象 的 包 缓 存 策略 ， 用 以 对 象 级 别 建 立 索 引 ， 并 对 一 个 内 容 分 块 数量 1 000 68~2 026 
对 象 的 前 N 个 数据 包 进 行 连续 存储 。 BF 容量 150 Bytes 90~210 Bytes 
在 实验 中 ， 假 设 用 户 请 求 服从 Zipf AAPA, eB 内 容 总 数 1 000 z 
将 默认 的 Zipf 分 布 参数 值 设 定 为 1.0。 此 外 ， 为 了 考察 Zipf 分 缓存 容量 1 000 
布 参数 对 缓存 性 能 的 影响 ， 将 其 值 的 变化 范围 设 定 为 0.7~1.3。 请 求 速率 200 req/s z 
假定 组 成 一 个 内 容 对 象 的 数据 包 数 量 服从 N (1000,2502)。 通 过 总 节点 数 100 2 
实际 采样 得 到 的 数据 包 的 数量 值 分 布 于 区 间 [68, 2026]。 利 用 流 边缘 路 由 器 数 66 
量 生 成 器 来 生成 可 变 流行 度 的 数据 包 并 分 别 采 用 BA AAE 仿真 时 间 180s 


RASAH. 和 WS 模型 和 aa 构建 实验 拓扑 。 实 验 拓 扑 由 100 
个 节点 构成 ， 包 含 一 个 随机 选择 内 容 服务 器 节点 和 66 个 边缘 
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图 4 缓存 性 能 趋势 
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前 十 名 链 路 Bloom Filter 容 量 低速 存储 器 容量 (GB) 
图 5 链 路 负载 率 图 6 存储 器 访问 减少 率 图 7 索引 占用 量 
4.2 性 能 指标 总 的 用 户 请 求 数 。 
本 文 定 义 了 如 下 性 能 指标 来 评估 GPC 方案 的 实际 性 能 : D) 平 均 跳 数 减 少 率 ,反映 由 于 缓存 系统 的 加 入 ， 使 用 户 请 求 
a) 服 务 器 负载 减少 率 , 用 来 描述 缓存 系统 使 内 容 服 务 器 工 内 容 跳 数 减 少 的 比率 ， 定 义 为 ; 
作 负 载 降低 的 比率 ， 有 具体 定义 为 a 
5 > hops_c 
SLRR =1- 2 =E 6) AHRR =1- i (4) 
R_counts D 
hops_nc 


其 中 :S_counts 表示 由 服务 器 响应 的 请 求 总 数 , 而 R_counts 表示 
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其 中 :hops_c 表示 缓存 命中 节点 到 请 求 用 户 之 间 的 跳 数 ,而 
户 到 内 容 服务 器 之 间 的 跳 数 , R_counts 表示 


hops_ne 表示 请 求 用 
总 的 用 户 请 求 数 。. 
c) 平 均 缓 存 命中 率 ,反映 所 有 缓存 节点 的 平均 命中 率 ， 定 义 


£ Hit _ counts, 


ACHR == (5) 
SER _counts, 
R 


其 中 :Hit_countsr 表示 用 户 请 求 在 路 由 器 r 处 命中 的 次 数 ， 
器 > 了 收 到 的 用 户 请 求 的 总 次 数 。 
d) 链 路 负载 率 , 反 映 特定 链 路 在 一 定时 期 内 的 流量 负载 状 


R counts, 表示 路 


况 。 
e) 存 储 器 访问 减少 率 , 反 映 由 于 加 入 Bloom Filter 使 得 访问 
存储 器 次 数 减少 的 比率 ， 有 具体 定义 为 
> F _ counts, 
SARR = {—___ (6) 


> R_counts, 
R 


其 中 :F_counts; 表 示 用 户 请 求 在 路 由 器 rx 处 被 Bloom Filter WHE 
的 总 次 数 ，R_counts; 表示 路 由 器 r 收 到 的 用 户 请 求 的 总 次 数 。 

fj) 索引 占用 量 ,反映 特定 节点 中 缓存 索引 所 占用 的 高 速 存储 
器 的 容量 。 
4.3 结果 分 析 

在 多 种 拓扑 下 进行 大 量 的 仿真 实验 ,分 析 了 各 种 策略 下 ， 
Zipf 分 布 参数 a FEL (0.7~1.3) 对 缓存 性 能 的 影响 。 结 果 表 明 
GPC 策略 在 定义 的 评价 指标 上 明显 优 于 其 他 方案 , 同时 内 存 的 
消耗 量 也 大 大 降低 了 。 
4.3.1 缓存 性 能 
图 4 (aj~(o 分 别 显 示 了 Zipf 参数 对 缓存 性 能 的 影响 。 随 着 
a 的 增加 , 所 定义 三 个 性 能 指标 都 有 所 改善 。 这 是 因为 随 着 zipf 
分 布 参数 的 增 大 ， 热 门 内 容 的 热度 也 随 之 增加 ， 这 有 助 于 缓存 
系统 的 性 能 的 发 挥 。 如 图 4 所 示 ， 本 文 方案 在 三 个 性 能 指标 方 
面 都 优 于 其 对 比方 案 。 另 一 方面 ， 可 以 发 现 GPC-8 获得 了 最 优 
的 缓存 性 能 ,这 是 因为 分 组 大 小 越 小 , 获得 的 热度 值 就 越 精确 ， 
从 而 作出 的 缓存 决策 也 更 加 准确 。 与 OPC 相 比 , GPC-8 在 三 项 
指标 上 的 平均 改进 分 别 为 29.53%，48.86% 和 82.36%. M- 
CEE 相 比 , 性 能 指标 的 平均 改善 可 以 达到 37.65% , 105.99% 和 
125.19% 。 
4.3.2 链 路 负载 率 
通过 收集 和 分 析 链 路 数据 传输 状态 来 评估 缓存 策略 对 链 路 
负载 率 的 影响 。 图 5 显示 了 不 同 缓存 策略 下 的 前 10 名 流量 负 
载 的 链 路 的 流量 负载 率 。 可 以 发 现 , 使 用 GPC -8 策略 的 场景 下 
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链 路 负载 率 明显 低 于 其 他 策略 。 就 该 项 指标 而 言 ， 
于 CEE 和 OPC 的 平均 改进 为 40.45% 和 19.08%。 
4.3.3 外 部 存储 器 访问 
图 6 显示 了 Bloom Filter 的 作用 。 通 过 Bloom Filter， 大 多 
数 请 求 都 直接 转发 而 无 须 访问 外 部 存储 器 。 在 图 6 中 ， 随 着 


GPC -8 相对 


Bloom Filter 容量 的 增加 , 转发 效果 逐步 提升 。 但 同时 可 以 发 现 
性 能 曲线 是 上 凸 的 ,表明 性 能 改善 率 不 断 下 降 , 也 就 是 说 Bloom 
Filter 的 效果 有 具有 上 限 , 因而 不 能 为 了 获得 更 好 地 过 滤 效 果 而 一 
味 增 大 其 容量 。 

43.4 索引 占用 量 


图 7 显示 了 低速 存储 器 容量 和 索引 大 小 之 间 的 关系 。 假 设 
每 个 索引 条 目的 大 小 是 40 个 字 节 ,而 数据 包 大 小 是 1500 Byte. 
GPC-8, GPC-16, GPC-32 的 Bit-Map 大 小 分 别 为 1，2，4 字 
节 。 对 于 GPC-8 来 说 一 个 索引 条 目 最 多 可 以 表示 8 个 数据 包 ， 
而 一 个 CEE 索引 条 目 只 能 标识 一 个 数据 包 。 因 此 ， 通 过 增加 组 
大 小 ， 索 引 条 目 数 量 也 可 以 减少 ， 因 而 高 速 内 存 使 用 量 可 以 相 


应 减少 。 
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本 文 提 出 了 一 种 全 新 的 数据 包 级 别 的 缓存 优化 方法 ， 它 从 
多 个 角度 入 手 缓解 了 NDN 架构 下 数据 包 级 别 缓存 所 遇 到 的 扩 
展 性 问题 。 该 策略 将 组 成 内 容 对 象 的 若干 数据 包 按 照 顺 寻 分 成 
多 个 分 组 ， 并 使 用 分 组 前 级 建立 索引 条 目 以 减少 高 速 内存 的 使 
用 量 。 另 一 方面 ， 利 用 外 置 的 Bloom Filter 过 滤 无 效 的 缓存 查 
和 旬 ， 加 速 数 据 包 的 转发 速率 。 此 外 ， 该 方案 根据 分 组 级 别 的 热 
度 统计 来 优化 缓存 决策 ， 提 高 缓存 整体 性 能 。 实 验 结果 表明 ， 
提出 的 方案 在 服务 器 负载 减少 率 ， 平 均 跳 数 减少 率 和 平均 缓存 


es 


命中 率 等 方面 优 于 现 有 解决 方案 ,并 且 显 着 提高 了 资源 利用 率 。 
下 一 步 将 继续 完善 该 方案 ， 并 将 其 部 署 在 在 实际 的 NDN 平台 
中 ， 进 行进 一 步 测试 和 应 用 。 
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